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Sommaire 


Le GTN-Québec a envisagé la possibilité de créer des fiches LOM à partir des métadonnées déjà 
présentes dans les documents. Cette option nous avait été suggérée par l'emploi des métadonnées 
dans le système de gestion de contenu [Alfresco] 1 . Le GTN-Québec a donc commandé cette 
première étude Évaluation de fonctionnalités de traitement des métadonnées par Alfresco en 
comparaison avec Normetic à WebConforme. Cette étude examine les métadonnées repérées par 
Alfresco dans divers types de documents, afin de voir lesquelles sont utilisables. Toutefois, une 
étude plus approfondie nous a montré qu' Alfresco utilisait l'outil [ExifTool] 2 de Phil Harvey pour 
extraire les métadonnées, et n'en exposait qu'une partie: une deuxième étude Rapport de travail 
sur ExifTool. succédant à celle-ci, a donc été réalisée par le secrétariat technologique. On y 
identifie également la possibilité d'employer le format de métadonnées extensible d’Adobe 
[XMP] 3 . L'approche semblant prometteuse, le secrétariat technologique a également développé 
un outil permettant de convertir des métadonnées d'un fichier ou d’une URL en une fiche LOM 
(voir l'outil). 


1 http://www.alfresco.com/fr/ 

2 http://www.sno.phv.queensu.ca/~phil/exiftool/ 

3 http://www.adobe.com/products/xmp/index.html 
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1. Protocole d'analyse 

- Compréhension de Normetic 1 .2, sa définition, ses exigences, son rapport au LOM (Learning Object 
Metadata), 

- Prise en main d' Alfresco (but, comment, fichiers, métadonnées...) 

- Définition des formats à étudier 

- Définition du processus de test et tests 

- Rapport préliminaire 

- Veille sur Alfresco et les extracteurs de métadonnées 

- Essai de paramétrisation dAlfresco et tests additionnels 


| Formats à étudier 

- formats de textes : - formats d’images : 


DOC (Word) 

- 

JPG 

ODS (Texte ODF) 

- 

GIF 

DOCX (Document 

- 

PNG 

Word 2008) 

_ 

TIFF 

TXT 

_ 

BMP 

HTML 

_ 

PSD 

XLSX (Classeur 

_ 

RAW 

Excel 2008) 

formats audio ou vidéo : 

XLS (Classeur 

Excel) 

- 

url vers une adresse 
Youtube 

XLS (Classeur Excel 
5.0/95) 

- 

url vers une adresse 
Dailymotion 

PDF, 

_ 

WAV 

PDF/A 


MP3 

RTF, 


MP4 

ODS (classeur 

ODF), 

- 

MPEG 

PPT (Présentation 

- 

AVI 

Powerpoint), 

- 

WMV 

PPTX (Présentation 

- 

MOV (Quick Time) 

Powerpoint 2008), 

- 

FLV 

PPS (Diaporama 

- 

SWF 

PPS) 

_ 

FLA 

PPSX (Diaporama 

_ 

WMA 

PPS 2008) 

_ 

AIF 


- M4V 

compression : 

- ZIP (arborescence et 
au moins 2 fichiers) 

- RAR (arborescence 
et au moins 2 
fichiers) 

- TAR 

- GZ 

Modèles de document : 

- DOT (Modèle de 
document Word) 

- DOTX 

- XLT (Modèle Excel) 

- XLSB (Classeur 
binaire Excel 2008) 

- XLTX (Modèle 
Excel 2008) 

- OTT (modèle de 
texte ODF), 

- OTS (modèle de 
classeur ODF), 

- POT (Modèle de 
conception 
Powerpoint), 
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- POTX (Modèle de Powerpoint 2008), 

conception 

| Définition du test 

Pour chaque format : 

- créer un fichier de test, 

- le remplir de métadonnées explicites qui puissent être facilement retrouvées et identifiées pour ce 
qu'elles sont hors du contexte du document (ex. : « nom du document » pour le nom du document, 
« Auteur principal » pour l'auteur principal...) 

si le format s'y prête, préparer une version française et une version anglaise du même document, 

- le sauvegarder dans Basecamp (comme fichier dans la catégorie « Contenu du site » 
https://webconforme.basecamphq.com/projects/3688339/files). 

- le charger dans Alfresco : Espace personnel / Tests Webconforme 

- repérer les méta-données qui en ont été extraites par Alfresco, 

- ajouter au rapport des formats en tenant compte : 

- des méta-données perdues 

- des méta-données modifiées (troncage, encodage, différence de casse...) 

- des méta-données attendues par Alfresco mais non présentes dans le document. 
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2. Rapport final 

| Rapport de formats 

Le rapport des formats est un tableau, fourni en annexe, présentant les résultats de tous les tests sur tous les 
formats. 

Toutes les métadonnées testées sont présentées, qu'elles fassent partie ou non du profil Normetic et qu'elles 
soient reprises ou non par Alfresco. 

Les formats de fichiers sont regroupés par famille de formats. 

Au vu du rapport de format il apparaît les points suivants. 


| Présence des éléments Normetic 1.2 dans Alfresco 



Requis 

Requis 

Conditionnel 

Recommandé 

Facultatif 

Total 

Eléments NE 1.2 

19 

3 

10 

26 

58 

Éléments repris par Alfresco 

4 

1 

0 

0 

5 


21% 

33% 

0% 

0% 

9% 


Les éléments Normetic 1 .2 sont peu nombreux à être présentés par Alfresco. Seuls les éléments suivants, 
obligatoires : 

- 4.1 Format, 

- 1.2 Titre, 

1.4 Description 
sont pris en compte. 

Deux autres éléments : 

1.5 Mot-clé, obligatoire conditionnel, 

1.3 Langue, obligatoire 

sont présents dans les les métadonnées de certains formats de fichier, mais ne sont pas récupérés lors du 
chargement du fichier dans Alfresco. 

| Conservation des métadonnées 

4.1 Format 

Le format est bien récupéré lors du chargement par Alfresco. 

Pour les formats texte, le format est bien identifié sauf pour XLSX (Excel 2007), PPS (Powepoint), PPSX 
(Powerpoint 2007). 

Pour les images, seul RAW pose problème. 

Pour les fichiers compressés, seul le ZIP passe. 
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Les audio et vidéo Quicktime AIF, M4V, MOV, MP3, WMA ne sont pas passés. 

1.2 Titre 

Les divers formats de texte traitent correctement le titre. Le fichier HTML utilise le contenu de la balis etitle du 
head. Seul le format PPS (MS Powerpoint) perd son titre. 

Pour les images, deux formats fonctionnent correctement : TIF et JPG. Le format PSD perd son titre. 

Aucun format d'audio ou de vidéo ne transmet son titre. 

Pour les modèles de documents, seul l'OTS (Open Office Cale) passe son titre. 

1.4 Description 

Les formats textes transmettent une description depuis des métadonnées différentes : 

- objet pour les fichiers Open Office Word, Excel, 

- sujet pour les Microsoft Office Writer, Cale, Powerpoint (sauf pour Powerpoint 2007 qui ne le permet 


pas), PDF, 


- balise meta description pour HTML 

Les images passent leur description sous la forme d'une métadonnée objet pour TIFF et JPG. Le PSD perd sa 
description en passant sur Alfresco. 

Pour les modèles, seul l'OTS (Open Office Cale) passe sa description sous forme de la métadonn éesujet. 



Extracteurs de métadonnées 

Aujourd'hui, certains formats de fichiers (par exemple, Microsoft Word) supportent directement les modèles de 
métadonnées simple. Alfresco offre la possibilité d'extraction des métadonnées pour certains de ces types de 
documents populaires automatiquement. 
http://wiki.alfresco.com/wiki/Metadata_Extraction 

Ajout de propriétés supplémentaires 

D'autres propriétés peuvent être ajoutées au contenu de trois manière : 

Une première façon consiste à étendre le modèle de données et définir des propriétés de plus dans un type de 
contenu. 

La seconde consiste à attacher dynamiquement les propriétés et les comportements par aspect. En utilisant des 
aspects, vous pouvez ajouter des propriétés supplémentaires telles que «Effectivity », « Dublin Core Metadata », 
et « Thumbnailable » au contenu. 

http : // www.packtpub . com/article/managing-content-in-alfresco 

La troisième consiste à utiliser XMP ( eXtensible Metadata Platform, http://www.adobe.eom/produets/xmp/f 
XMP fournit un format standard pour la création et la gestion des métadonnées (metadata). 
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XMP est une technologie d'Adobe permettant d'ajouter des données relatives à un fichier directement dans le 
fichier lui-même, et ce sous forme de méta-données. Les données ainsi incluses deviennent donc inséparables du 
document auquel elles correspondent, et circulent avec le document lui-même à l’intérieur ou à l’extérieur de 
l’organisation, au travers des workflows et des réseaux. Les données ainsi définies peuvent être lues, modifiées, 
et enrichies tout au long du processus et du cycle de vie du document, et ce, indépendamment des plates-formes 
utilisées, (source : http ://www. alkero , com/Livre_blanc_XMP.pdf ) 

Alfresco possède deux extensions XMP qui permettent la manipulation de données XMP en extrayant les 
métadonnées par un extracteur XMP et en ajoutant des données directement dans le fichier (embeder). 
http://forge.alfresco.com/projects/xmp 
http : // forge, alfresco . com/proi ects/embedders 
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1. ANNEXE 

Rapport des formats « rapport des formats.xls 
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